查看原文
其他

MiniMax创始人闫俊杰:如果10年后全球只剩5家大模型公司,第二名一定是中国企业|钛媒体AGI

林志佳 钛媒体AGI
2024-09-05
钛媒体App 6月17日消息,近日,国内 AI 独角兽公司MiniMax创始人兼CEO 闫俊杰,在一场与明势资本创始合伙人黄明明“非共识和长期最优解”对谈中表示,AI企业的研发投入一定会越来越大,尽管短期内国内外都会产生很多竞争,但长期来看,如果未来5年或10年,假设全世界只有3家公司或5家大模型公司,其中第二名一定是中国公司。
“因为首先,在中国就有10亿互联网的用户,至少在用户规模上中国是绝对领先的;
其次,我认为从人才上,中国目前整体环境、创新能力距离美国还是落后的,但也能看到很多优秀的人会回来,并且说我们可以不一定要把 AI 想象成一个特别神秘的事情,它可能跟很多其他学科一样,比如类似新能源、生物制药。我相信,中国虽然说目前落后,但中国整体的人才质量、人才生态会越来越好。所以到那个时候,我觉得中国最好的公司至少人才可能会比美国其他公司好;
第三,短期的算力限制,包括芯片制程、通讯等支持上是落后的,但是我们在通讯互联是世界级的所以把这些因素都考虑在一起,中国用户基数就已经是很多发达国家加在一起了。闫俊杰表示。
闫俊杰强调,未来,如果全球 AI 大模型企业排名中,不是第一,至少第二会有一家中国的公司,如果再往后的话,至少第四或者第五是中国公司。但是如果我们更加幸运的话,可能会有家中国 AI公司变成第一。
据悉,MiniMax成立于2021年,是领先的通用人工智能(AI)科技公司,致力于与用户共创智能,坚信不走捷径、User-in-the-loop和技术驱动。公司创始人、CEO闫俊杰(IO)曾担任商汤科技副总裁、商汤科技研究院副院长、通用智能技术负责人。
技术产品层面,MiniMax已提供端到端自研的多模态大语言模型和abab和MiniMax开放平台,以及C端的星野、海螺AI等。
仅开放平台方面,MiniMax在今年透露,公司服务了近千家客户,包括金山办公、小红书、腾讯、小米和阅文在内的多家头部互联网公司,MiniMax 开放平台平均单日的 token 处理量达到了数百亿。
融资方面,成立两年来,MiniMax已完成了B轮融资,投资方包括阿里、腾讯、红杉中国、高瓴创投、IDG资本等,估值已超过10亿美元,成为中国估值最高的大模型公司之一,同时也是国内头部 AI 独角兽企业。
此次是闫俊杰罕见地参与一场线下对话,短短40余分钟,内容涵盖创业过程中的各种方面。钛媒体AGI对此次对话的部分信息进行简要梳理。

为什么要创立MiniMax?


闫俊杰坦言,其实是经历了两个非常极端的事情,才意识到必须得这么做。
“第一个,我写了很多论文,做了很多研究和系统。然后突然间,我有一个读代数几何的同学,那个领域属于数学里面最高端的几个领域之一,然后有一天他告诉我说,他的老师去世了。这个时候我就意识到,这么重要的一个前沿领域,可能实际上懂这个领域的人,全世界可能只有二十几个人,因此这意味着这个领域的进步其实是非常随机的。然后我就在想,如果是这么重要的领域,然后又这么依赖随机的单个人的话,这个领域的进步一定会遇到挑战,怎么样能够让一个前沿的领域能够持续的进步,除了培养更好的人之外,那个时候我开始想到是,如果我们有更好的AI,是不是也可以来实现这件事?所以说,那个时候,假设我们认为技术进步是重要的,除了我们培养更好的人才之外,还有另外一种方式是说,利用 AI 做更多研究。
比如说,我的老家在一个县城里面,我经常去回到县城,然后就观察县城的人很多生活,比如我外公,他可能七、八十岁了,他有一天告诉我说,他想写一本过去几十年的经历,当然这个经历可能也没有很多人关心了,但我是很关心的。然而问题是,我发现他并没有办法把一个书给写出来,因为这个东西需要非常强的组织能力,甚至需要打字记录,那显然是,我认为AI 可以设法帮助他。
因此,那个时候我就开始意识到,不管是最前沿的事,还是最普通人的事儿,可能都是需要很好的技术创新。但问题是,当时 AI 都是非常定制的,其实都很难变成一个被大众使用的这么一套技术,从长远来看这个东西却很重要,短期我们做的事又看起来好像没有那么重要,一定是方法不对,或者我们做的事的路线是不太对的。
那个时候我就开始意识到,为了能解决这个问题,唯一的办法就是把 AI 变得更加通用,然后变成普通人生活中的一部分。因此,我想到一定要做通用人工智能,一定要做AI to C,但那个时间点还没有大模型这个词,我们则需要把表达能力改进,把它(AI)用一种比较简化的语言来描述出来,类似于数字人这种。”
谈到创业的性格联系,闫俊杰坦言,“我从小在一个比较落后的地区长大,现在很多时间生活在城市,但是我还是有机会经常去看一下,比如说老家人是怎么样生活的,然后很明显的观察是说,他们可能是比城市里的人可能是更需要 AI 的帮助。不管是老人,还是像我这样正在工作的人,甚至比如一些更年轻的学生。
我们在城市里面的很多人,有一次有人告诉我说,他觉得什么样的AI产品好,他就看让他的 AI 助理来做什么事,他就觉得他跟他助理的交互方式就是一个好的产品的形态,但是问题是说这种人还是非常少的,然后中国有这么多的人。但就是说当你观察了很多这样的人之后,你就会意识到,当你通过 AI 产品来帮助到这些人,其实会有一个巨大的成就感。”

当前 AI 技术发展如何?


闫俊杰表示,AI 技术大概经历了三个阶段:
第一个阶段是在2020年之前,那时更多的 AI 体现在大学的实验室,以及很多大公司都有 AI 技术。本质上,AI 做的事是说通过想一些更好的算法,然后来解决一些特定的业务问题。
AI的时候在这一代里面其实不是独立存在的,它更多的是一个现有的业务,现有产品的其中一个环节,然后把其中某个特定的功能能够效率变得更高,我觉得是在深度学习出来之后,大模型出来之前的这么一个阶段。
再比如说,做一些人脸识别、语音识别,很多美颜拍照用这样一种方式,大概从2020年开始,当然美国已经有这样的公司了。
到现在为止,我觉得我们处在 AI 第二个阶段,AI 已经可以变成一个独立的产品形态,存在成为一个核心的变量,就是 AI 能变成通用了。通用的意思就是,不需要定制,从而可以服务更多的场景。当你能够开发更多的场景,然后才会有独立价值,这里面的标志比如说生产力产品、娱乐类产品可以开始用 AI 原生技术实现。
但是,我们现在处的第二个阶段的问题是什么?问题的话是说,现在的用户规模,它的渗透率还没有那么高,怎么样能够提高这些渗透率,主要是靠技术进步、产品创新。
此前因为我们发现,至少在我们自己的产品上,用户量拐点基本上都是来自于模型能力的提升。这是一个非常显著的现象。
从2021年创立至今两年多,如果我们能够再经历一次这种更大的一个技术变革,比如用GPT-4这种实用模型,把错误率从20%、30%,降低到3%、2%、1%,这样的话模型可以变得更加靠谱,从而有可能会产生新的形态。而这种新的形态,将来会促进更高的渗透率、更多的用户时长、用户交换频次、超越上一代算法推荐类的App,从而可以到一个更高的价值上。
我觉得这里面的拐点是,模型的错误率能够再降低一个数量级,同时的话,这些应用的规模能够再大两个数量级,我觉得可能会进入到第三个阶段。
对于中美 AI 的投入,我们可以看一些客观的数字,在中国现在排名比较靠前的AI创业公司,可能账上会有10亿美金,或者类似这样一个体量,但这个其实不是一个创业公司的赛道,它其实是创业公司跟上一代这些大科技公司在一起比拼的赛道。
比如,我们可以举例子,我们可以看一下美国的几家公司——Google、微软、亚马逊AWS,接下来几年(三年)在GPU上的CAPEX(Capital Expenditure,资本性支出),可能都是千亿美金这个量级的。
这个基本上是美国几家大厂的一个共识。
我觉得在中国的话,比如像字节跳动、腾讯、阿里,可以有这么多钱,但是再加上这些算力的限制,其实这些钱其实也花不出去。所以,不管是有钱的大厂,还是没有钱的创业公司,在算力层面的投入可能都要小1~2个数量级。
这是接下来两三年内,非常确定的一件事。
但我认为也有幸运的事,就是全世界有这么多的国家地区,可能也只有中国有这样的一个投入,中国至少还是站着的。
虽然说是比美国落后,但至少(中国)还是比其他国家显著领先的,然后我觉得也不能特别的抱怨,更应该想接下来怎么来做。客观事实是,如果把 AI 做好,需要的资源和投入除了算力、数据、算法之外,更重要的是用户。因为AI不止是模型,还有一部分体现在用户的创造上。
因此,客观来说,我们模型就是会落后一些,只是说通过我们很多努力,可以把落后的时间的代差能够尽可能缩小;宏观来说,我们其实可以更好的跟用户在一起,利用用户的创造来弥补这样一些差距。我觉得这个事应该就可以把它简化成为:技术上的追赶 x 更多的用户创造 AGI。”

为什么MiniMax在融资10亿美金的时候不迭代参数,而是要赌MoE(混合专家)模型的未来?


2024年1月,MiniMax宣布全量发布大语言模型 abab6,为国内首个 MoE 大语言模型。在 MoE 结构下,abab6 拥有大参数带来的处理复杂任务的能力,同时模型在单位时间内能够训练足够多的数据,计算效率也可以得到大幅提升。改进了 abab5.5 在处理更复杂、对模型输出有更精细要求场景中出现的问题。
但研发MoE模型过程中,当时MiniMax正在进行10亿美金的一轮重要融资。他向投资人表示,这几乎压上了公司80%的资源,失败过两次。
闫俊杰回应称,坦白说这是由两个东西导致的,一个是创业者还是偏理性分析,二是意识到C端产品带来的价值本质上还是模型能力的提升。
”那个时候,我们发现,我每天要支撑的使用量已经非常大了,然后那个时候应该是大概每天要处理大概几百亿的token,到年终看,一个Dense模型的话,我们是没法每天处理这么多token,而且很快会因为推理成本的问题耗尽所有的钱。因此,那个时候我们就意识到了这件事。
然后还有另外一个问题是说,因为客户上来说,我们那个时候就已经非常明显的知道,虽然说它外表上是一个c端产品,但是它给用户带来的价值本质上还是模型能力的提升。那个时候如果我们做Dense模型的话,我们可以非常容易看到我们的天花板,基本上就在那儿了。虽然说,会比我们那个时间点更好,但是天花板其实就在那儿了。因此,如果我们要追求一个更高的天花板,必须要做技术创新,所以它实际上不是说有两条路你可以来选,而是说你发现为了实现的目标,实际上那是唯一的一条路。
因此,至少在那个时间点,我觉得是MoE是更好模型的一个必要条件。可能1万条路当中,只有那条路可以通向你想要的目标。因此,赌上MoE,我觉得是当时相当于你就只能这样了,你做不出来可能就挂了。”
闫俊杰强调,“我们这次创业相对来说比较新的一件事是,我们知道这个事太难了,他既然很难的话,其实你优化1个月、3个月、6个月的目标,意义没有那么大。因为它是一个很长期的事情。我们内部叫不走捷径,最终就变成了我们的公司价值观的第一条,就是“不走捷径”。”
在闫俊杰看来,短期的模型优化可能让外界感知,但是对长期的目标没有太大的意义。
“其实当时还是很慌的。但当你想不清楚的时候其实会纠结,而你想清楚了,发现它就是唯一这条路,因为知道其他的路可能就走不通。所以,其实即使着急也没用,还是只能往前走,因为基本上已经确定了,他就是这样的了。”闫俊杰称。

谈Intelligence with Everyone:杀手级App应用和大模型的关系是什么?


闫俊杰称,“这是来自于MiniMax创业过程中形成的一个哲学:Intelligence with Everyone。”
“因为那个时候我们同时意识到两件事:第一件事是,AI 的价值就在于服务普通人,因为我们看一下整个社会的分层的话,大部分人都是普通人,其实意味着,AI的价值是能够让更多的普通人来使用你的产品。因此,如果你要服务普通人,唯一的办法是说以产品的形式能够辐射到这么多的人。
你的用户创造多大的价值,你的用户越多,你的价值就会越大。
第二点是说,技术的进步其实是需要依赖于很多用户的交互反馈。而反馈不一定是说,直接点了一个赞或者点了一个踩,其实有多种各样维度的信息,而用户反馈其实是让模型变得更好的一个非常核心要素。
因此,本质上不是说 AI for everyone,做了一个很好的技术然后给别人,而是说,我们在跟用户一起来创造更好的 AI。而这个就是我们对技术跟产品的理解。用户的创造,其实是模型和产品的一部分,而不是说分散的两种个体。”闫俊杰表示。

为何公司业务调整的时候你没有一丝一毫的犹豫?


谈到公司管理,在闫俊杰看来,人和人才是公司里面最核心的资产,但行业存在很多不确定性,如今效率跟效果几乎就是等价的。因此,创业者唯一要做的是,提高技术进步带来的效率,因此,需要寻找更多优秀的人进入卓越的组织,并且在不断调整、循环当中将企业发展壮大。
闫俊杰表示,“我觉得这是一个非常关键的问题,因为你想一下,比如说假设一家公司没有员工了,剩下的东西可能只是一些钱和一些模型和一些用户,这样的话他其实是没法变得更好的发展。
然后,人和人才我觉得是公司里面最核心的资产,因为这些因为人和人才其实是创造了后面的东西。
我在做这家公司的时候,其实就想明白了很多事儿,因为你的各种资源都很有限,各种竞争也很激烈,然后这个目标就特别的难,里面有身上各种各样的不确定性,很多东西是你完全无法掌控的。在这个时候的话,唯一的办法就是能够来化简为繁,就是只来想里面最底层最本质的那些东西,然后不要被一些浅层东西所迷惑。如果来想到这种最底层东西的话,我觉得唯一的一件事,其实就是技术进步的效率。因为技术进步的效率,跟技术进步,它的效果其实是相互转换的。假设你的计算资源是有限的,你的效率高,意味着你给大家更快,所以这两个东西在传统 AI 上是不等价的,但在这个时代,效率跟效果几乎就是等价的。
所以说,如果是说你的唯一目标就是研发效率的话,从而推出来,什么样的研发和组织形态,是让它的研发效率能够以一个期望比较高的方式、比较高的效率形成的,或者是说一个好的组织应该长什么样,应该怎么来运转,应该找什么样的人,怎么样能让一个组织,从一些优秀的人变成一个比较卓越的组织。所以,唯一的办法就是说找到里面最精简的几条核心原理,然后基于这个原理来推出来,你应该怎么来做。然后当你遇到错误的时候,那就不停的来调整它。
我觉得,底层想的越清楚,然后上层的犯错的概率就越低,基本上就是这么一个,有一定反馈信号的一个循环。”
(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)

万水千山总是情,点个在看行不行
素材来源官方媒体/网络新闻
继续滑动看下一个
钛媒体AGI
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存